Big Data คืออะไร


ในยุคปัจจุบันที่โลกถูกขับเคลื่อนด้วยข้อมูล ผู้คนพึ่งพิงข้อมูลในการตัดสินใจต่างๆ กระบวนการคิดของคนทั่วไปหรือแม้แต่องค์กรต่างๆในทุกวันนี้ส่วนใหญ่อยู่บนฐานของการรวบรวมข้อมูล ประมวลผล เพื่อประกอบการตัดสินใจทำอะไรบางอย่าง แต่ด้วยความที่ข้อมูลในปัจจุบันมีอยู่มากมายและกระจัดกระจาย คำถามสำคัญ คือ เราจะเข้าถึงข้อมูลมหาศาลเหล่านั้นและใช้ข้อมูลเหล่านั้นให้เป็นประโยชน์ได้อย่างไร จากคำถามดังกล่าวจึงทำให้คนหันมาสนใจสิ่งที่เรียกว่า Big data กันมากขึ้นจนกลายเป็นกระแสสังคมในปัจจุบัน

What is big data?

Big data คือ ข้อมูลที่ประกอบด้วยคุณลักษณะ 4 อย่างคือ

1. Volume — size ของข้อมูลมีขนาดใหญ่ มีปริมาณข้อมูลมาก ซึ่งสามารถเป็นได้ทั้งข้อมูลแบบ offline หรือ online

2. Variety — ข้อมูลมีความหลากหลาย สามารถเป็นได้ทั้งที่มีโครงสร้างและข้อมูลที่ไม่สามารถจับ pattern ได้

3. Velocity — ข้อมูลมีการเปลี่ยนแปลงตลอดเวลาอย่างรวดเร็ว มีการส่งผ่านข้อมูลอย่างต่อเนื่องในลักษณะ streaming ทำให้การวิเคราะห์ข้อมูลแบบ manual มีข้อจำกัด

4. Veracity — ข้อมูลมีความไม่ชัดเจน (untrusted, uncleaned) โดยรูปแบบของข้อมูลของ big data ก็สามารถเป็นไปได้หลากหลาย ตั้งแต่

1. Behavioral data: ข้อมูลเชิงพฤติกรรมการใช้งานต่างๆเช่น server log , พฤติกรรมการคลิกดูข้อมูล, ข้อมูลการใช้ ATM เป็นต้น

2. Image & sounds: ภาพถ่าย, วีดีโอ, รูปจาก google street view, ภาพถ่ายทางการแพทย์, ลายมือ, ข้อมูลเสียงที่ถูกบันทึกไว้ เป็นต้น

3. Languages: text message, ข้อความที่ถูก tweet, เนื้อหาต่างๆในเว็บไซต์ เป็นต้น

4. Records: ข้อมูลทางการแพทย์, ข้อมูลผลสำรวจที่มีขนาดใหญ่, ข้อมูลทางภาษี เป็นต้น

5. Sensors: ข้อมูลอุณหภูมิ, accelerometer, ข้อมูลทางภูมิศาสตร์ เป็นต้น

Big data analytics

การวิเคราะห์ข้อมูล Big data อาศัยหลักการพื้นฐานบางอย่างเพื่อพัฒนาเป็นเทคนิคในการดึงข้อมูลสำคัญออกจากชุดฐานข้อมูลขนาดใหญ่ที่เต็มไปด้วยข้อมูลหลากหลายรูปแบบ เพื่อนำมาหา pattern ของข้อมูลที่มองไม่เห็นด้วยตาเปล่า หารูปแบบความสัมพันธ์ที่ซ่อนอยู่ หาแนวโน้มการตลาด เทรนด์ความชอบของลูกค้า และข้อมูลอื่นๆที่เป็นประโยชน์ทางธุรกิจ

ผลจากการวิเคราะห์ข้อมูล Big data ทำให้มีข้อมูลที่เป็นข้อเท็จจริงซึ่งผ่านการวิเคราะห์อย่างเป็นระบบเพื่อใช้ประกอบการตัดสินใจ โดยระดับของการวิเคราะห์ก็เป็นได้หลากหลาย แล้วแต่รูปแบบการนำไปใช้งาน

การต่อสายไฟฟ้าด้วยไวร์นัท (Wire nut) จะต้องใช้วิธีหมุน เพื่อให้ไวร์นัทรัดสายให้แนบชิดกันก่อน เมื่อต่อเสร็จเรียบร้อยแล้ว ไม่ต้องใช้เทปพันตรงสายไฟ เนื่องจากปลอกของไวร์นัทเป็นฉนวนอยู่แล้ว ซึ่งจะทำให้จุดต่อสายไฟดังกล่าวลงกราวด์ได้ ซึ่งการต่อสายไฟฟ้าด้วยไวร์นัทนั้น จะนิยมนำมาต่อในกล่องต่อสาย (Junction box) โดยเฉพาะการเดินสายในท่อร้อยสาย ส่วนการใช้เทปพันสาย ซึ่งเทปพันสายนั้นเป็นวัสดุฉนวนไฟฟ้าที่นิยมใช้ทั่วไปนั้น จะมีราคาถูก (ควรเลือกเกรดที่ดี)

1. Descriptive analytics

เป็นการวิเคราะห์ในระดับที่บอกว่าเกิดอะไรขึ้น จำนวนเท่าไหร่ ถี่แค่ไหน เกิดเหตุการณ์สำคัญๆตอนไหน ตรงไหนบ้าง เป็นต้น โดยสามารถทำในรูปแบบของ

- Standard report: “เกิดอะไรขึ้น”

- Ad hoc report: “จำนวนเท่าไหร่ บ่อยแค่ไหน ที่ไหน”

- Query: “อะไรคือปัญหาที่แท้จริง”

- Alerts: “ต้องเกิด action อะไร”

2. Predictive analytics

เป็นการวิเคราะห์ในลักษณะที่ซับซ้อนขึ้นไปอีกขั้นหนึ่งคือ เป็นการประเมินว่าจะเกิดอะไรขึ้นต่อไป มีการให้ข้อมูลตัวชี้วัดของผลลัพธ์ที่อาจจะเกิดขึ้นถ้าแนวโน้มยังเป็นอย่างนี้ต่อไป โดยผลการวิเคราะห์อาจออกมาในรูปแบบของ

- Statistical analysis: “ทำไมถึงเกิดเหตุการณ์นี้”

- Randomized testing: “จะเกิดอะไรขึ้นถ้าเราทดลองทำวิธีการนี้”

- Predictive modeling: “จะเกิดอะไรขึ้นต่อไป”

- Optimization: “อะไรคือสถานการณ์ที่ดีที่สุดที่จะเกิดขึ้น”

3. Prescriptive analytics

เป็นการสังเคราะห์ข้อมูลเพื่อวิเคราะห์แนวโน้มและเสนอทางเลือกในการตัดสินใจที่เหมาะสมกับการคาดการณ์บนฐานของข้อมูล

Why big data now?

มีหลายคนที่เกิดคำถามว่าทำไมเรื่อง big data จึงกลายเป็นกระแสในปัจจุบัน อ.ธีรณีได้ให้ความเห็นว่า กระแสนี้เป็นผลที่จากเกิดหลายๆองค์ประกอบ ไม่ว่าจะเป็น

• Demand for better data เกิดกระแสกดดันภายใต้บริบทของการปฏิรูป สภาวะทางเศรษฐกิจ และนวัตกรรมใหม่ๆ

• Supply of relevant data at scale มีการแพร่หลายและไหลเวียนของข้อมูลทั้งข้อมูลทางการแพทย์และข้อมูลอื่นๆที่สามารถเข้าถึงได้ทั่วไป

• Technical capability มีการพัฒนาเทคนิคในการวิเคราะห์ข้อมูลจำนวนมากที่ทันสมัย ทำงานง่ายขึ้นและเข้าถึงได้แพร่หลาย

• Government catalyzing market change มีแรงส่งจากภาครัฐที่ถูกกดดันให้มีการเปิดเผยข้อมูลให้โปร่งใสจนกระจายไปสู่ภาคธุรกิจอื่นๆ

จากนี้เราคงเห็นเทรนด์ในการใช้ Big Data ในการสร้างสรรค์นวัตกรรมใหม่ ๆ เกิดขึ้นอีกเรื่อย ๆ เป็นกระแสที่น่าติดตามอีกกระแสหนึ่งเลยทีเดียว